ECOLE D’ETE CIST 2022

Inventaire des données sur le Benin

Claude Grasland (Université de Paris (Diderot), UMR 8504 Géographie-cités, FR 2007 CIST)

featured

1 Sources

Nous inventorions ici les principales sources de données utilisables pour le Bénin ou les autres pays de la formation.

1.1 Humanitarian Data Exchange (HDX)

Il s’agit d’une source majeure qui semble utilisable dans tous les pays.

1.1.1 OCHA

Le sigle OCHA désigne le United Nation Office for the Coordination of Human Affairs dont la vocation est de fournir une aide dans les situations d’urgence. Sa mission qui est expliquée en détail sur son site web comporte de nombreux volets. Cette agence est organisée sur un plan régional et comporte notamment une délégation spécialisée dans les pays d’Afrique Centrale et de l’Ouest appelée OCHA-ROWCA qui couvre l’ensemble despays ciblés par l’école d’été du CIST.

1.1.2 HDX

Pour mener à bien ses actions l’OCHA-ROWCA a développé un grand nombre de bases de données qui sont mises à jour régulièrement avec un accès à première vue facile. Ces données sont accessiblesà travers la plateforme Humanitarian Data Exchange (HDX) qui semble avoir été mise au point par OCHA. Cette plateforme HDX ne comporte pas seulement des données mais aussi différents outils de visualisation ou d’analyse.

Cela pourrait donc constituer une source majeure de données pour l’école d’été CIST 2022-2023, mais il faut en faire un inventaire précis. L’objet de cette note est de procéder à quelques explorations préliminaires en prenant comme cible le Bénin.

Si nous effectuons une requête Benin sur le site de données HDX ce qui conduit à une liste de 142 sources de données provenant soit de OCHA-ROWCA, soit d’autres agences des Nations-Unies (FAO, WorldBank, WolrdPop, …). On trouve encore plus de sources (environ 200) si on utilise le menu de recherche par pays car le moteur ajoute dans ce cas des bases de données transnationales.

Le HDX est donc un véritable hub de concentration des données les plus récentes sur les pays qui nousintéressent pour l’école d’été, et pas seulement le Benin.

Comme on ne peut tout explorer d’un coup, nous commençons par les données qui viennet à proprement parler d’OCHA-ROWCA.

2 Données

Dans cette section nous proposons de rassembler des tableaux de données harmonisées en vue de l’école d’été CIST 2022. Nous privilégions l’exemple du Bénin qui sera le lieu de la formation. Chaque tableau de données fait l’objet d’un exemple rapide d’application de méthodes statistiques ou carographiques afin de vérifier la fiabilité et la qualité des données

2.1 Limites administratives

Le dossier des limites administratives du Benin fourni par HDX (cliquer ici) est accessible au format shapefile et comporte différentes couches correspondant aux différents niveaux administratifs. Sa datation laisse augurer qu’il s’agit de la situation la plus récente: les fichiers datent de juin 2021 mais leur nom comporte la séquence “20190816” qui doit plutôt correspondre au 16 Août 2019. En pratique, les limites sont celles du recensement de 2013.

N.B. nous avons toutefois découvert une erreur importante dans le code de la commune d’Adjara qui est noté BJ0101 alors que le code exact est BJ1001. Nous avons également constaté une variabilité des noms de vraiables désignant les codes dans la base OCHA. C’est pourquoi nous avons préféré harmoniser les fichiers.

Départements et communes du Bénin (Source : OCHA-ROWCA)

Départements et communes du Bénin (Source : OCHA-ROWCA)

2.2 Pyramide des âges 2019

Un dossier du HDX accessible ici fournit les populations par âge et par sexe en 2019 au niveau des communes, départements ou pays entier. Il s’agit naturellement d’estimations mais les données n’en sont pas moins très utile pour toute analyse travaillant sur les situations présentes. Les classes d’âges sont suffisamment détaillées (tranches de 5 ans de 0 à 80 ans) pour procéder à des analyses démographiques intéressantes. A titre d’exemple, on réalise une AFC sur la pyramide des âges des 77 communes

AFC sur les structures par âge et sexe des communes du Benin en 2019 (Source : OCHA-ROWCA)

On enchaîne par une CAH (sur les axes de l’AFC) :

Type de structures par âge et sexe des communes du Benin en 2019 (source : OCHA)

Type de structures par âge et sexe des communes du Benin en 2019 (source : OCHA)

Position des classes de la CAH sur les axes de l'AFC (source : OCHA)

Position des classes de la CAH sur les axes de l’AFC (source : OCHA)

Il reste à visualiser les classes. On crée pour cela une fonction assez complexe de comparaison entre le profil de celles-ci et le profil du Bénin, inspirée d’un programme trouvé sur un forum du CIRAD

Profils moyens des classes (source : OCHA)

Profils moyens des classes (source : OCHA)

  • la classe 1 : correspond à une population beaucoup plus jeune que la moyenne du pays avec un excédent de 0-9 ans et un déficit de 30 ans et plus. C’est la partie du pays où la transition démographique semble être la plus tardive
  • la classe 2 : présente également un profil de population jeune avec un excédent de 5-14 ans, mais se caractérise par une réduction relative des 0-4 ans qui témoigne soit d’une baisse de la fécondité, soit d’un exode rural des jeunes ménages avec enfants.
  • la classe 3 correspond au profil moyen du pays.
  • la classe 4 est caractérisée par un excédent de personnes âgées et un déficit à la fois de jeunes enfants et de jeunes adultes. Elle correspond à des zones de vieillissment relatif de la population, soit sous l’effet de l’exode rural, soit en raison d’une baisse de la fécondité.
  • la classe 5 est caractérise par une forte surreprésentation des jeunes adultes et des persones âgées, associée à un net déficit des enfants jeunes de 0 à 14 ans. Il s’agit vraisemblablement de zones urbaines caractérisées par une fécodité plus tardive et une meilleure espérance de vie.

On peut visualiser la distribution de ces cinq classes sur une carte :

Distribution spatiale des classes (source : OCHA)

Distribution spatiale des classes (source : OCHA)

2.3 Alphabetisation et langues (2013)

2.3.1 Métadonnées

Ce fichier qui est accessible sur HDX en suivant ce lien a été mis à disposition par l’organisation Translators without borders mais l’analyse des métadonnées montre qu’il s’agit en fait de données extraites du recensement géénral de population du Bénin de 2013 :

Created by Translators without Borders, Uploaded on Jun-21, Version 1

Notes and caveats

  • All data is drawn from government survey results and is subject to any associated limitations or distortions present in the source data.
  • Literacy was measured as the ability to read and write in any language. Languages with population shares less than 0.01% or under 1,000 people (whichever is greater) have been aggregated into the “Other” field.
  • All decimal values have been rounded to a maximum of 3 decimal places. As a result language shares may not total 100%.
  • Empty values represent non-existent data and should not be treated as zero values. Data is available under an Attribution NonCommercial ShareAlike 4.0 International license (CC BY NC SA 4.0)

Copyright and terms of use

  • You are free to share and adapt the data subject to requirements for attribution and non commercial use.
  • Any derivative work must be distributed under the same license as the original. Full terms at https://creativecommons.org/licenses/by nc sa/4.0/

2.3.2 Préparation des données

Les fichiers fournies comportaient de petites erreurs ou des difficultés de formatage rendant compliquée leur importation dans R. Il a donc fallu les corriger un peu avant de les utiliser. Une fois cela effectué, on a vérifié que les données pouvaient se cartographie en effectuant une jointure avec le fichier administratif au niveau communal.

N.B. nous avons retrouvé l’erreur dans le code de la commune d’Adjara qui est noté BJ0101 alors que le code exact est BJ1001. Nous avons donc reconstruit les fichiers en les harmonisant avec les fonds de carte.

2.3.3 Variables d’alphabétisation

Le fichier comporte tout d’abord un ensemble de variables concernant le niveau d’alphabétisation des hommes et des femmes de plus de 6 ans en 2013. Voici à titre indicatif les valeurs par département et pour l’ensemble du pays :

ADM1_CODE ADM1_NAME pop_total pop_male pop_female literacy_all literacy_male literacy_female
BJ01 Alibori 872500 435070 437430 0.2411522 0.2800548 0.2028016
BJ02 Atacora 786350 385520 400830 0.3697587 0.4450240 0.2987815
BJ03 Atlantique 1417420 699260 718160 0.6529884 0.7560399 0.5546867
BJ04 Borgou 1228980 611910 617070 0.4172042 0.4703573 0.3647056
BJ05 Collines 717580 355000 362580 0.5494504 0.6415866 0.4607534
BJ06 Couffo 747530 347990 399540 0.5146621 0.6490924 0.4019793
BJ07 Donga 547790 271290 276500 0.4165344 0.4913587 0.3443179
BJ08 Littoral 683970 328190 355780 0.7939093 0.8747998 0.7209568
BJ09 Mono 506620 246530 260090 0.6348241 0.7547283 0.5222640
BJ10 Oueme 1103370 536610 566760 0.6400245 0.7459637 0.5422918
BJ11 Plateau 627710 302360 325350 0.4621522 0.5612206 0.3719805
BJ12 Zou 857110 411050 446060 0.5354925 0.6407501 0.4412843

Ce tableau se prêtera particulièrement bien à des exercices d’initiation à la statistiques et la cartographie sous R puisqu’il comporte à la fois des stocks (population par sexe), des taux (% de population alphabétisée par sexe) et une possibilité de les combiner pour retrouver le nombre de personnes alphabétisée. Il s’inscrit par ailleurs pleinement dans la thématique des inégalités territoriales.

On peut à titre d’exemple construire une cartographie du niveau d’alphabétisation des hommes et des femmes par département du Bénin en 2013 (carte choroplèthe) et superposer par dessus les effectifs correspondants d’hommes et de femmes alphabétisés.

Alphabétisation des hommes et femmes du Bénin par département en 2013 (source : RP Bénin 2013, via OCHA)

Alphabétisation des hommes et femmes du Bénin par département en 2013 (source : RP Bénin 2013, via OCHA)

On voit apparaître alors une assez forte corrrélation entre les deux distributions, même si les femmes sont moins alphabétisés que les hommes. Ce qui suggère un exercice d’apprentissage de la régression linéaire entre les deux variables.

Dependent variable:
literacy_female
literacy_male 0.793***
(0.068)
Constant -0.047
(0.043)
Observations 12
R2 0.932
Adjusted R2 0.925
Residual Std. Error 0.038 (df = 10)
F Statistic 136.646*** (df = 1; 10)
Note: p<0.1; p<0.05; p<0.01

Les résultats mettent en évidence le fait que l’alphabétisation des femmes au Bénin en 2013 est en moyenne inférieure de 20% à celle des hommes (le paramètre b de la régression est non significatif) et la relation est statistiquement très significative (r2 = 93 %, p < 0.001). Il existe notamment des résidus c’est-à-dire des départements où la scolarisation des femmes estimée en fonction de celle des hommes est plus forte que prévue (Alibori, Borgou, Littoral) ou plus faible que prévue (Plateau, Couffo, Mono).

Le même modèle appliqué au niveau des communes permettrait une analyse plus fine des résultats à travers une carte des résidus. On pourrait aussi imaginer une analyse mutiscalaire croisant les écarts des communes à la moyenne du pays, de leur département et des communes voisines à l’aide du package mta. Bref, il s’agit sans nul doute d’un excellent exemple pédagogique pour l’école d’été CIST2022.

2.4 Villages et localités vers 2015

Un autre dossier accessible en cliquant ici concerne le peuplement, c’est-à-dire l’inventaire de toutes les localisations avec leur nom et leur position en latitude longitude. Il comporte 6306 entrées. Les fichiers sont datés de 2015.

Village et peuplement au Benin vers 2015 (Source : OCHA-ROWCA)

Village et peuplement au Benin vers 2015 (Source : OCHA-ROWCA)

A titre de vérification de la précision, nous effectuons une superposition sur le fonds de carte OpenStreetMap pour la commune de Ouidah (code BJ0304 ou BEN003004) ou aura lieu l’école d’été du CIST. En cliquant sur les points onpeut comparer leur nom avec celui des localités indiquées par OSM.

Projection des données OCHA-ROWCA sur Open Street Map (commune de Ouidah

Il y a à l’évidence des décalages … Et le contour de la commune lui-même ne semble pas coller exactement avec celui fourni par OSM. Il faudra vérifier laquelle des deux sources est erronée (à moins que ce ne soient les deux ?). Toutefois, la localisation semble rester approximativement juste …

Bibliographie

BARNIER, Julien, 2021. rmdformats: HTML Output Formats and Templates for ’rmarkdown’ Documents [en ligne]. S.l. : s.n. Disponible à l'adresse : https://github.com/juba/rmdformats.
R CORE TEAM, 2020. R: A Language and Environment for Statistical Computing [en ligne]. Vienna, Austria : R Foundation for Statistical Computing. Disponible à l'adresse : https://www.R-project.org/.
XIE, Yihui, 2020. knitr: A General-Purpose Package for Dynamic Report Generation in R [en ligne]. S.l. : s.n. Disponible à l'adresse : https://CRAN.R-project.org/package=knitr.

Annexes

Infos session

setting value
version R version 4.1.0 (2021-05-18)
os Windows 10 x64
system x86_64, mingw32
ui RTerm
language (EN)
collate French_France.1252
ctype French_France.1252
tz Europe/Paris
date 2021-10-01
package ondiskversion source
cowplot 1.1.1 CRAN (R 4.1.1)
data.table 1.14.0 CRAN (R 4.1.0)
dplyr 1.0.6 CRAN (R 4.1.0)
DT 0.18 CRAN (R 4.1.0)
explor 0.3.9 CRAN (R 4.1.1)
FactoMineR 2.4 CRAN (R 4.1.0)
ggplot2 3.3.3 CRAN (R 4.1.0)
knitr 1.34 CRAN (R 4.1.1)
leaflet 2.0.4.1 CRAN (R 4.1.1)
mapsf 0.2.0 CRAN (R 4.1.0)
rmarkdown 2.11 CRAN (R 4.1.1)
rzine 0.1.0 gitlab ()
sf 1.0.0 CRAN (R 4.1.0)
stargazer 5.2.2 CRAN (R 4.1.0)
tidyr 1.1.3 CRAN (R 4.1.0)

Citation

@Manual{ficheRzine,
    title = {Titre de la fiche},
    author = {{Auteur.e.s}},
    organization = {Rzine},
    year = {202x},
    url = {http://rzine.fr/},
  }


Glossaire